Naeliton - Departamento de Ciencias Contabeis UFPE (Amostra de Análise Descritiva)
Introdução
Esta uma amostra de análise de dados descritiva feita sob a indicação de necessidade do discente Naeliton Souza Pinho do Dep de Ciencias Contabeis da UFPE.
Carregamento das bases de dados
Base de Dados das Procuradorias
O instrumento de coleta de dados foi a base de dados da Procuradoria-Geral da Fazenda Nacional referente ao ano de 2024 de cada estado brasileiro que foram juntados em uma base de dados comum, onde através de manipulação da base de dados a classificação das regiões de atuação do orgão foi feita conforme indicado no site https://www.gov.br/pgfn/pt-br/acesso-a-informacao/institucional/abrangencia-territorial-das-unidades-da-pgfn
Análises Geral (Todos os Tipos de Negociação)
Nessa seção serão feitas as análises descritivas simples (média, mediana e desvio padrão) para o discente começar o trabalho de análise mais aprofundada e fundamentada na literatura do TCC.
Análise Geral Feita por Região (Todos os Tipos de Negociação)
Análise feita por região tem por objetivo dar uma visão da distribuição dos dados tal como o orgão é organizado.
Brasil
# Calcular estatísticas adicionais
tabela_moda <- dados %>%
summarise(
Moda = mfv(`Qtde de Parcelas Concedidas`, na_rm = TRUE) # mfv() retorna a moda
) %>%
t() %>% # Transpor para exibição
as.data.frame() %>%
tibble::rownames_to_column("Estatística") %>%
rename(Valor = V1)
# Criar tabela descritiva
tabela_descritiva <- dados %>%
select(
`Qtde de Parcelas Concedidas`,
`Valor Consolidado`,
`Valor do Principal`,
`Valor da Multa`
) %>%
tbl_summary(label = list(`Qtde de Parcelas Concedidas` ~ "Qtde de Parcelas Concedidas",
`Valor Consolidado` ~ "Valor Consolidado",
`Valor do Principal` ~ "Valor Principal",
`Valor da Multa` ~ "Valor da Multa"),
statistic = list(all_continuous() ~ "{mean} (Média), {median} (Mediana), {sd} (Desvio Padrão)"),
missing = "no") %>%
as_gt() %>% # Converter para gt para adicionar a tabela extra
gt::tab_spanner(label = "Estatísticas Descritivas", columns = gt::everything()) %>%
gt::tab_source_note(gt::md(paste0(
"**Moda das Parcelas Concedidadas:** ", tabela_moda$Valor[tabela_moda$Estatística == "Moda"]
)))
# Exibir tabela
tabela_descritiva|
Estatísticas Descritivas
|
|
|---|---|
| Characteristic | N = 2,284,0961 |
| Qtde de Parcelas Concedidas | 32 (Média), 18 (Mediana), 33 (Desvio Padrão) |
| Valor Consolidado | 58,565 (Média), 4,108 (Mediana), 626,854 (Desvio Padrão) |
| Valor Principal | 8,654 (Média), 1,200 (Mediana), 376,408 (Desvio Padrão) |
| Valor da Multa | 694 (Média), 0 (Mediana), 15,033 (Desvio Padrão) |
| Moda das Parcelas Concedidadas: 60 | |
| 1 Mean (Média), Median (Mediana), SD (Desvio Padrão) | |